查看原文
其他

百度智能云助力自动驾驶全链路研发

XM 百度智能云技术站
2024-09-11

本文整理自 2022 年 12 月的智算峰会 · 自动驾驶分论坛上的同名主题分享。

此次分享是自动驾驶分论坛的第一个演讲主题,是之前已经发布的三期自动驾驶分论坛演讲的概括性总结,整体介绍了百度智能云的自动驾驶解决方案。

百度智能云通过 AI 大底座、自动驾驶工具链以及基础云底座资源,为自动驾驶提供了软硬件一体的基础平台。


1. 百度在智驾和智舱领域的成果

百度在智能驾驶和智能座舱这两大领域里面都有自己的产品。

在智能驾驶方面,百度的 Apollo 目前是国内做得最好的 L4 级别的自动驾驶产品,在北京亦庄、上海嘉定均有萝卜快跑在运营。此外,百度的城市辅助领航驾驶(ANP)、自主泊车解决方案(AVP)、高精地图、车规级硬件产品都在很多合作车厂量产落地。

在智能座舱领域,百度也跟很多车厂进行了合作。百度目前有 70 多家合作车企,800 多个合作车型,已经实现了 2000 万+的智能驾驶和智能座舱能力的搭载。

2. 从自动驾驶感知算法看自动驾驶对云计算的需求

自动驾驶的开发对云计算和 AI 技术都有非常强的依赖性。在下面这张图中,我们整理了做自动驾驶感知算法对云计算技术的需求。

从下图我们可以看出,如果做 L2、L3 级别的 Demo,我们只需要百万级的图片和几张卡的训练即可实现。由于数据量很小同时使用范围有限,从合规的角度来讲,要求也不是很高,几百万的费用就可以实现这样的一个简单的 Demo。但是如果要做 L2、L3 级别的量产,投入的资金就上了一个量级,可能就要到几千万,而这仅仅是在感知算法的数据和计算平台相关方面的投入。

而到了 L4 的时候,即使是感知算法的 Demo,它需要存储的数据量也超过了 1 PB,同时需要上百张 GPU 训练卡,相关的投资规模达到 0.5 亿 - 2 亿级别。而如果要实现 L4 级别的量产车迭代,相关的投入就是更是超过了 5 亿,所需的数据量也会达到几十个 PB。在这个过程中,整个数据闭环的运转过程需要 24 小时以内完成。只有这样,我们前一天在路上碰到的某个场景,第二天它才能够成为场景库的一部分,帮助企业能够进行持续的测试。这样才能够真正地支持 Level 4 持续的开发和量产。

而在数据闭环的研发能力上,通过专业采集得到的数据经过脱敏和标注后,进入到训练平台进行训练,得到相应的模型。模型持续优化迭代之后,会经过嵌入平台移植到量产车中。

最后,我们再通过汽车的影子模式把某些我们感兴趣的场景的数据采集再上传回来,这样就可以用量产车来帮助我们进行数据采集。虽然它单车采集的数据量没有专业采集那么大,但从整体来讲,它会帮助我们获得更加丰富的场景数据。

我们可以看到整个数据闭环的流程、数据闭环的数据量规模、使用的 GPU 资源规模都是非常大的。如此大规模的数据处理和训练需要很强的云计算资源的支持。

3. 自动驾驶解决方案全景图

这是我们的自动驾驶解决方案的全景图。可以看到处于最中间的是我们用于数据使用处理的百舸平台和 AI 中台,即 AI 大底座。AI 大底座可以部署在百度智能云的公有云、私有云、或者客户的专属云上面。

在这个 AI 大底座上我们部署自动驾驶的采集、标注、数据闭环、自动驾驶、云仿真和运营服务等工具链体系,这些工具链体系再来支持自动驾驶开发的各个场景,包括研发迭代、数据回传、能力评估、驾驶仿真等等,这样就形成了对整个自动驾驶业务从 AI 大底座、工具链到场景的一个完整的研发支持。

百度的自动驾驶的工具链可以说是业界最强的,我们提供了从数据采集、数据合规、数据标注、数据管理、训练&仿真等自动驾驶核心能力的数据运营服务和工具链平台,可以方便地定义各种数据、筛选、处理的算子,也支持用户自定义算子。

通过这种方式,我们可以很快找到和筛选出来对算法改进最有用的数据。同时还可以通过这些数据挖掘出在 L4 训练以及测试过程中所没有遇到过的场景,然后在 24 小时内将该场景输入到我们的仿真平台中,成为我们场景库的一部分。

4. 自动驾驶的弹性策略

对于很多企业来说,投资如此大而完整的平台所需要的费用是非常大的。也正因此,我们设计了如下的弹性策略以满足不同类型企业的不同需求。

在下图中我们可以看到,从整个自动驾驶的开发过程来讲,百度提供了大部分的能力(灰色部分)。也正因此,我们可以为不同的企业做提供不同的定制服务。举例来说,对于一般的 Tier1 、Tier2 ,对重资产的投入是比较谨慎的。对于这样的客户,百度智能云可以通过合规云的机制来提供重资产能力。而轻资产部分,可以是百度智能云投入研发来支持,也可以是我们的 Tier2 客户来做。这样就比较适合资金、规模都比较小的 Tier2 企业,仅投入几百万就可以串联起一个小型的数据闭环。

对于资金比较雄厚的 OEM 来说,它可以选择和百度智能云合作的方式来进行重资产投入(图中深灰色部分)。这也就意味着该部分资源的费用由 OEM,也就是我们的客户来提供,百度智能云则提供对应的技术支持。这部分落地的产物一般为 OEM 客户的私有云,或者部分私有云,部分通过百度智能云的公有云机制/合规服务机制来提供。

5. 自动驾驶工具链一览

下图是我们的自动驾驶的工具链。我们可以看到 2020 年、2021 年百度均在自动驾驶能力排行的第一阵营,这里还有 Tesla、Cruise、Argo AI、Waymo 等公司。在这些公司里面只有百度把自己的工具链提供给其他的客户使用。我们是以一种开放的心态来去做这样的事情,因为当越来越多的人来使用,实际上就在为整个行业的快速发展提供助力。

百度的自动驾驶工具链里面包括几大平台:数据平台、标注平台、研发平台和仿真平台。

  • 数据平台主要针对采集来的海量数据进行数据清洗和数据处理,同时对原始数据进行场景挖掘,方便后面去做场景库的转化。

  • 标注平台主要分为标注项目管理和标注工具的管理两大部分,帮助我们对标注过程的不同角色和不同环节做高效的项目管理,以及提供更快速准确的标注服务。

  • 研发平台主要解决大规模的模型训练和管理的能力,帮助客户构建有效的训练集,提升模型指标与调优模型。

  • 仿真平台里,包含了我们刚才说的大规模并行仿真,可以在云上动态开启资源,在很短的时间内完成几千上万的场景仿真测试。当我们的场景库积累越多,仿真测试的覆盖面也就越来越广。


6. 数据合规
当采集到这么多数据后,有一个很重要的问题需要考虑,就是数据合规。目前,国家有好几套法律体系都在严格地对数据进行管控。一类是测绘地理安全相关的法规,因为带有测绘属性的数据不允许出现在公网上,必须有合规以及相关资质的企业来提供数据的采集和处理服务,而且要时刻监管数据的流动。另一类是跟个人隐私相关的数据,需要经过脱敏之后才能使用,包括人脸、车牌等等。这些都是跟数据的安全、个人隐私息息相关的法律。百度对这些法律的要求都做到了非常谨慎细致的落地,以确保企业在合规的前提下能够更方便地使用这些数据。

对于自动驾驶研发企业来讲,它必须有自己的数据的合规方案。
自动驾驶的数据采集,都需要有资质的图商来进行作业,包括通过车上安装的各种传感器,采集到的位置数据、传感器的图像数据、点云数据等。而采集到的数据,由于数据量特别大,我们一般会通过移动硬盘送到合规云上,即图商管理区(相关的测绘数据不可以离开图商管理区)。
在合规云的合规作业室中,敏感的测绘数据要进行一次脱敏和脱密处理,变成非敏感的测绘成果(要注意,它虽然非敏感,但它还是测绘成果,还是不能够离开图商管理区)。但这部分数据已经可以让我们的模型作业人员、模型训练人员、开发人员去接触。他们可以基于百度百舸以及基础云的能力,利用这里面的数据进行自动驾驶的研发、模型训练、数据处理、数据挖掘。
如果数据想要离开图商管理区,需要经过脱敏脱密变成不具备测绘属性的非测绘成果的数据,然后经过图商的管理员进行严格的审查之后,才能够离开图商管理区,进入到私域网络、或者公有云网络里面去进行使用。
另外,我们刚刚提到了量产车的数据回传。当这部分的数据传输过来后,再经过车端加密与脱敏,就进入到智能采集云,经过短暂的缓存后,同样会被送到合规云里面来,这样就形成一个完整的闭环管理。
在自动驾驶的研发上,我们的技术方案已经支持了很多汽车制造、自动驾驶公司的相关工作
我们希望这套方案能够服务更多的公司,为中国的自动驾驶的研发提速做出自己的贡献。谢谢大家!
- - - - - - - - - - END - - - - - - - - - - 
点击阅读原文,了解百度百舸更多内容

传送门

  1. 百度百舸·AI 异构计算平台,加速自动驾驶模型迭代

  2. 打造合规数据闭环,加速自动驾驶技术研发

  3. 自动驾驶工具链及仿真平台的应用

  4. 云原生 AI 的资源调度和 AI 工作流引擎设计分享

  5. AI 训练加速原理解析与工程实践分享

  6. AI 推理加速原理解析与工程实践分享

  7. 双引擎 GPU 容器虚拟化,用户态和内核态的技术解析和实践分享

  8. 构建AI原生的智能计算基础设施,百度百舸·AI异构计算平台2.0发布

  9. 面向高性能计算场景的存储系统解决方案

  10. AI 应用的全流程存储加速方案技术解析和实践分享

继续滑动看下一个
百度智能云技术站
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存